一种基于RVO策略和最优控制算法的混合型多智能体协同路径规划方法

您所在的位置:网站首页 算法 策略 一种基于RVO策略和最优控制算法的混合型多智能体协同路径规划方法

一种基于RVO策略和最优控制算法的混合型多智能体协同路径规划方法

2022-12-17 03:49| 来源: 网络整理| 查看: 265

技术特征:1.一种基于rvo策略和最优控制算法的混合型多智能体协同路径规划方法,其特征在于,包括以下步骤:步骤1:根据待规划的智能体个数确定参与规划的智能体数量m,其中m∈n+,初始化各个智能体对应的初始状态和终端状态;对于第i个智能体,其初始状态记为终端状态记为其中i∈n+;步骤2:初始化协同路径规划过程中的计算步长δt,以及rvo策略与最优控制算法切换的阈值参数d,其中d≥0;步骤3:依次检测各智能体当前位置与对应终端位置之间的距离与阈值d之间的关系,判断是采用rvo策略,还是采用最优控制算法对智能体进行路径规划,具体如下:步骤3-1:初始化时间迭代次数k,令k=1;初始化rvo策略和最优控制算法切换次数j,令j=0;步骤3-2:在[t0+(k-1)δt,t0+kδt]内,初始化智能体序号i,令i=1,其中,t0表示起始时间;步骤3-3:检测智能体i当前位置与对应终端位置之间的距离;对于智能体i,将智能体i采用圆心为其几何中心位置半径r的特征圆进行描述,计算智能体i在t0+(k-1)δt时刻的位置与对应终端位置之间的距离si(t0+(k-1)δt),具体计算方法为:其中,分别表示描述智能体i特征圆圆心的横纵标和纵坐标;分别表示智能体i终端位置的横纵标和纵坐标;步骤3-4:若智能体i当前位置与对应终端位置之间的距离si(t0+(k-1)δt)大于阈值d,则采用rvo策略对智能体i进行轨迹规划,并存储其轨迹、时间数据;若智能体i当前位置与对应终端位置之间的距离si(t0+(k-1)δt)小于或等于阈值d,则转入步骤3-5,采用最优控制算法对智能体进行路径规划;步骤3-5:将该智能体i当前时刻的状态作为初始边界条件xi(t0+(k-1)δt),确定各个智能体的运动学、控制、状态约束条件;对于第i个智能体,令其状态空间为xi、控制变量为ui,建立该智能体的运动学方程:其中,t为时间变量;对于第i个智能体,将该智能体对状态变量和控制变量施加的约束表示为如下不等式形式:c(xi,ui,t)≤0ꢀꢀꢀꢀꢀꢀꢀꢀ(3)步骤3-6:建立智能体i轨迹规划的最优控制模型根据公式(1)(2),建立如下智能体i轨迹规划的最优控制模型:其中,w为终端时间权重因子;tf表示末端时间;步骤3-7:求解最优控制模型根据公式(4),采用最优控制算法对其进行求解,优化出最小末端时间及对应的路径数据,并在接下来的时间步长内将其视为按照由最优控制算法所得到路径运动的动态障碍物;同时,令j=j+1;步骤4:若j;m,且i<m-j,i=i+1,返回步骤3-3;若j;m,且i≥m-j,令k=k+1,转入步骤3-2;若j≥m,退出并输出每个智能体使用rvo策略和最优控制算法得到的轨迹。2.根据权利要求1所述的一种基于rvo策略和最优控制算法的混合型多智能体协同路径规划方法,其特征在于,所述步骤1中初始状态、终端状态均包括初始、终端处的位置、角度、速度。3.根据权利要求1或2所述的一种基于rvo策略和最优控制算法的混合型多智能体协同路径规划方法,其特征在于,所述的最优控制算法包括伪谱法、保辛伪谱算法。

技术总结一种基于RVO策略和最优控制算法的混合型多智能体协同路径规划方法,属于自动化与控制技术领域。首先,根据待规划的智能体个数来确定参与规划的智能体数量,初始化各个智能体对应的初始和终端状态。其次,初始化协同路径规划过程中的计算步长,RVO策略与最优控制算法切换的阈值参数d。最后,依次检测各智能体当前位置与对应终端位置之间的距离与阈值d之间的关系:若智能体当前位置与对应终端位置之间的距离大于阈值d,采用RVO策略对该智能体进行轨迹规划;若距离小于或等于阈值d,采用最优控制算法对该智能体进行路径规划。本发明能够高精度的进行多智能体在线协同路径规划,所得到的结果能够严格符合终端约束要求,实现计算效率和精度之间的理想平衡。和精度之间的理想平衡。和精度之间的理想平衡。

技术研发人员:刘洁 董献洲 高岚岚 雷霆 徐卫国 彭超 徐浩 樊硕 邱凯 施展受保护的技术使用者:中国人民解放军军事科学院战争研究院技术研发日:2021.08.27技术公布日:2022/1/21



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3